El deporte une las masas y la FIFA a través de los años ha reforzado su influencia tanto en el plano deportivo como en el político a través del futbol, el torneo actual en el que asume como sede Qatar no ha sido exento a ello, entre controversias de corrupción, violación de derechos laborales. Qatar hoy en día alberga las 32 selecciones clasificadas en las eliminatorias de las confederaciones continentales con la ilusión de ganar la copa del mundo y representar a su país.
La’eeb Mascota oficial del Mundial Qatar 2022
Como parte de la narrativa de este análisis, es necesario conocer un poco más sobre Qatar como nación e ir incorporando el plano futbolístico de las selecciones en este evento. En primer lugar, Qatar “es una Península situada en medio de la costa Occidental y el Golfo Arábigo, entre las latitudes (24,27> y 26.10») Norte, y longitud (50.45» y 51.40») Este. Es una península que se extiende hacia el norte en las aguas del Golfo cubriendo 11,521 kilómetros cuadrados” (Mérica Del Sur-Países Árabes Cumbre, 2022, p. 13).
Su clima es desértico moderado con veranos calientes, en cuanto a su población, esta nación desciende de las antiguas tribus árabes que emigraros de la península de arábiga y conforman un aproximado de 1.5 millones de habitantes.
La elección de Qatar como sede ha sido de las mas controvertidas en la historia de la World Cup dado a una serie escándalos y políticas internas del país. Sin embargo, en el “En 2010 Qatar se aseguró los derechos a la Copa del Mundo al ganar una votación de los 22 miembros ejecutivos de la FIFA. El país derrotó las candidaturas de Estados Unidos, Corea del Sur, Japón y Australia, para convertirse en la primera nación árabe en albergar el torneo.” (BBC, 2022, sp).
En total serán ocho las sedes que albergarán los 64 partidos que representa el torneo de la World Cup en un total de cinco ciudades. Con 32 selecciones participantes de las 6 confederaciones continentales.
El objetivo de los siguientes datos, es realizar un análisis
exploratorio para examinar las distintas métricas de interés
relacionadas a los aspirantes a ganar la Copa del Mundo que se dará en
Qatar 2022. En el cual, a través de la visualización de los datos
recopilados en cada Copa del Mundo desde su inicio en Uruguay 1930 se
puede conocer la evolución de las selecciones participantes. En este
sentido se usará como librería principal tidyverse para
proceder con la limpieza y análisis de los datos. Consecutivamente, la
librería dplyr para mantener la gramática del código
ejecutado y la librería readr para la importación de los
archivos en formato .cvs. Con reactablefmtr se
buscó la mejora del estilo y el formato de las tablas. Por último, la
librería ggplot2 permitió realizar las distintas graficas
para la visualización de los datos en conjunto con las librerías
ggthemes y gganimate para la optimización de
los gráficos.
#instalar en caso de no poseer
#install.packages("readr")
#install.packages("ggthemes")
#install.packages("gganimate")
#install.packages("reactablefmtr")
library(tidyverse)#manejo de datos## Warning: package 'tidyverse' was built under R version 4.2.2
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.6 ✔ purrr 0.3.5
## ✔ tibble 3.1.8 ✔ dplyr 1.0.10
## ✔ tidyr 1.2.1 ✔ stringr 1.4.1
## ✔ readr 2.1.2 ✔ forcats 0.5.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
library(dplyr)
library(readr) #lectura de cvs
library(ggplot2) #Manejo de Grafico
library(ggthemes) #Manejo de temas en graficos
library(gganimate)#creacion de animaciones en graficos## Warning: package 'gganimate' was built under R version 4.2.2
library(reactablefmtr) #mejora el estilo y el formato de las tablas ## Warning: package 'reactablefmtr' was built under R version 4.2.2
## Loading required package: reactable
## Warning: package 'reactable' was built under R version 4.2.2
##
## Attaching package: 'reactablefmtr'
##
## The following object is masked from 'package:ggplot2':
##
## margin
En cuanto a la fuente de recopilación de los datos desde el Archivo de la Copa Mundial de la FIFA y RSSSF, se comparte todos los partidos de las copas mundiales anteriores, las clasificaciones en partidos pasados y los grupos concebidos para el actual torneo permitiendo crear una serie de datos que admitan la visualización de datos frente a la edición de Qatar 2022. Para obtener la data usada en la presentación se usó un repositorio de datos en el siguiente sitio web Mavenanalytics en él se disponen internamente de un zip file un total de 7 archivos en formato .CVS con el que se albergan las Data set correspondientes para su análisis de los cuales solo se tomaron dos, denominados “World Cup World cup matches.csv” y “World Cup 2022 World cup groups.csv”.
world_cup_matches <- read_csv("World+Cup/world_cup_matches.csv")## Rows: 900 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (4): Stage, Home Team, Away Team, Win Conditions
## dbl (4): ID, Year, Home Goals, Away Goals
## lgl (1): Host Team
## date (1): Date
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
X2022_world_cup_groups <- read_csv("World+Cup/2022_world_cup_groups.csv")## Rows: 32 Columns: 3
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): Group, Team
## dbl (1): FIFA Ranking
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Los datos que se alojan en las columnas permiten reconocer el registro de cada selección desde el año 1930. Entre los conceptos que son relevantes para entender el fondo del repositorio de datos se describe los siguientes conceptos:
La definición de los indicadores se encuentra enmarcado desde un tipo de observación sistemática basado en rankings, histogramas, tablas y otros tipos de visualizaciones con los datos recolectados en los partidos jugados en ediciones anteriores de la Copa del Mundo. Para ello, este segmento reside en tomar en cuenta la experiencia y los datos estadísticos de las 32 selecciones con la intención de conocer a las selecciones favoritas por los aficionados y las tendencias que la caracterizan en ediciones pasadas.
Durante esta primera exploración la cantidad de observaciones dentro
del paquete de datos obtenidos anteriormente, el primer archivo a
gestionar consta de 900 observaciones y 10 variables en el archivo
“World Cup Matches.cvs” en él se detalla las variables ID,
Year, Date, Stage,
Home Team, Home Goals,
Away Goals, Away Team,
Win Conditions y Host Team. Es relevante
resaltar que en cuanto a valores faltantes dentro de esta tabla se
encontró dentro de la columna de Win Conditions solo
N/A. Esto se puede observar en la parte inferior.
head(world_cup_matches)## # A tibble: 6 × 10
## ID Year Date Stage Home …¹ Home …² Away …³ Away …⁴ Win C…⁵ Host …⁶
## <dbl> <dbl> <date> <chr> <chr> <dbl> <dbl> <chr> <chr> <lgl>
## 1 1 1930 1930-07-13 Group … France 4 1 Mexico <NA> FALSE
## 2 2 1930 1930-07-13 Group … United… 3 0 Belgium <NA> FALSE
## 3 3 1930 1930-07-14 Group … Yugosl… 2 1 Brazil <NA> FALSE
## 4 4 1930 1930-07-14 Group … Romania 3 1 Peru <NA> FALSE
## 5 5 1930 1930-07-15 Group … Argent… 1 0 France <NA> FALSE
## 6 6 1930 1930-07-16 Group … Chile 3 0 Mexico <NA> FALSE
## # … with abbreviated variable names ¹`Home Team`, ²`Home Goals`, ³`Away Goals`,
## # ⁴`Away Team`, ⁵`Win Conditions`, ⁶`Host Team`
Posteriormente, se hizo uso del archivo denominado “World Cup
Groups.cvs” en el cual detalla las variables
Group, Team y FIFA Ranking como igualmente se observa en la
parte inferior y que consta de 32 observaciones y 03 variables en el
archivo.
head(X2022_world_cup_groups)## # A tibble: 6 × 3
## Group Team `FIFA Ranking`
## <chr> <chr> <dbl>
## 1 A Qatar 50
## 2 A Ecuador 44
## 3 A Senegal 18
## 4 A Netherlands 8
## 5 B England 5
## 6 B Iran 20
Como parte del desarrollo de las métricas de interés de los equipos aspirantes a ganar la Copa del Mundo Qatar 2022 se gestionan una serie de interrogantes relacionadas a la experiencia de las selecciones participantes y su rendimiento en el torneo.
El deporte une a las masas y el futbol desde sus inicios no ha sido exento a ello, desde su institucionalización en 1860 separándose del Rugby como juego se crea la primera asociación del futbol. Ya para el año 1904 ante el aumento de la popularidad de este deporte surge como ente regulador la Federación Internacional de Futbol Asociación conocido popularmente como la FIFA en el cual su primer campeonato acreditada como la Copa del Mundo Uruguay 1930 con la participación tan solo 4 selecciones europeas. En la actualidad, el significado del futbol como deporte no ha variado mucho. Sin embargo, la relevancia económica, social y cultura que representa la FIFA como institución y el futbol en cada nación posee un impacto digno de ser estudiado en cada faceta en este caso será netamente deportivo.
Para entender el futbol es importante conocer quienes juegan, quienes son los favoritos, cuando gana y cuando pierde. Las interrogantes planteadas responden a la narrativa de obtener un panorama general de las selecciones previo a Qatar 2022 por lo que se responderán a medida que se da el análisis. No obstante, la premisa transcendental se basa en la ruta de histórica de las selecciones con mayor favoritismo y éxito en sus participaciones dentro del torneo. Para ello, se debate ¿Cuáles son los equipos favoritos en el torneo?, ¿Cuánto es el promedio de goles de las selecciones favoritas?, ¿Cómo se comparan a otras selecciones?. Y, por último,¿Cuáles son sus tendencias de juegos ganados y perdidos cuando son campeones?, Para ello, se considera el uso de estadísticas descriptivas para el análisis y entendimiento de los resultados. Iniciamos examinando a las selecciones con más goles en el Torneo FIFA World Cup desde su inicio con la carga de datos anteriormente descriptos para facilitar la lectura de los datos. en tanto se puede apreciar en el registro de la siguiente tabla todos los goles registrados desde el primer torneo en orden descendete de las selecciones que participaron anteriormente.
# Cantidad de anotaciones por selección en el torneo FIFA World Cup desde el primer torneo oficial en Uruguay 1930
# Separacion de la tabla por equipo segun los goles obtenidos en el torneo
wcup_goal <- world_cup_matches[c("Home Team", "Home Goals","Away Goals", "Away Team")]
#Creacion de una nueva columna en el data frame
team_column <- c("Team", "Goals")
#filtro y asignacion de goles obtenidos en condicion de Home dentro de team_column
h_cup <- wcup_goal %>%
group_by(`Home Team`) %>%
summarise(`Home Goals` = sum(`Home Goals`),
)
colnames(h_cup) <- c("Team", "Home")
#filtro y asignacion de goles obtenidos en condicion de Away dentro de team_column
a_cup <- wcup_goal %>%
group_by(`Away Team`) %>%
summarise(`Away Goals` = sum(`Away Goals`),
)
colnames(a_cup) <- c("Team", "Away")
#Union y reodenamiento de las tablas de goles obtenidos en un orden descendente
total_gol <- merge(h_cup, a_cup, by = "Team", all = TRUE)
total_gol$total <- total_gol$Home + total_gol$Away
total_gol <- total_gol[with(total_gol, order(-total)), ]reactable(
total_gol,
defaultSorted = "total",
defaultSortOrder = "desc",
defaultColDef = colDef(
cell = data_bars(total_gol, text_position = "outside-base")
)
)Tal como se refleja en los primeros 10 datos de la tabla desde las
variables Team, Home, Away y
total. Se observa las selecciones con mayor cantidad de
goles, a su vez, se ejecuta la sumatoria histórica de los goles en cada
selección en base a todas sus participaciones comprimiendo en las
ultimas posiciones a las selecciones con menor cantidad de
anotaciones.
De lo que se percibe la tabla anterior, se extrae el registro de las primeras 5 selecciones con más anotaciones en partidos oficiales de la World Cup, cuyo esquema va liderado por la selección de Brasil.
# Top 5 selecciones más goleadoras
fav_teams <- c("Brazil", "Argentina", "France", "Spain", "England")
total_top_5 <- total_gol %>%
filter(`Team` %in% fav_teams) %>%
select(Team, Home, Away, total)# GRAFICA 2 Top 5 selecciones más goleadoras
ggplot(total_top_5, aes(x = reorder(Team, -total), y = total)) +
geom_segment(aes(x = reorder(Team, -total),
xend = reorder(Team, -total),
y = 0, yend = total),
color = "gray", lwd = 1) +
geom_point(size = 7.5, pch = 21, bg = 4, col = 1) +
geom_text(aes(label = total), color = "white", size = 3) +
xlab("Team") +
ylab("") +
coord_flip() +
theme_minimal() + #tema del grafico
shadow_mark() + #sombra de la animacion
enter_grow() + #animacion de crecimiento
transition_states(total, wrap = FALSE) + #transicion de la animacion
labs(title = "Top 05 de selecciones más goleadoras", #titulo del grafico
subtitle = "Qatar 2022", #subtitulo del grafico
caption = "Fuente: Archivo de la Copa Mundial de la FIFA y RSSSF",
tag = "Figura 1",
x = "Selecciones", #etiqueta del eje x
y = "Cantidad de Goles", #etiqueta del eje y
)Como se refleja, históricamente la selección con más goles anotados en la historia del torneo es Brasil con 229 tantos. En segundo lugar, se encuentra la selección Argentina con 137 goles, sucesivamente se posicionan las selecciones de Francia y España con 120 y 99 goles en el tercer y cuarto lugar cubriendo en el quinto puesto la selección Inglaterra con 91 goles.
Ante las expectativas de los aficionados en conocer a los favoritos
para participar en la final de Qatar 2022 y con la intención de conocer
¿Cuáles son los equipos favoritos en el torneo?, se ha
desarrollado un promedio de anotaciones entre las cinco selecciones
favoritas en la casa de apuesta Betfair el
día 23 de noviembre de 2022 en el que, según la información suministrada
por este medio, se posiciona a las selecciones de
Argentina, Brasil, Inglaterra,
Francia y España. Como las principales
aspirantes a llegar a ultimas instancias.
# 3 Filtro de datos "Promedio de goles anotados en todas sus participaciones en el torneo dentro de los cinco (5) equipos favoritos para participar a la final de Qatar 2022 segun la casa de apuesta betfair"
top_fav <- total_gol %>%
filter(`Team` %in% fav_teams) %>%
select(Team, Home, Away, total)
#conteo de todos los partidos jugados de las seleciones favoritas
home_matches <- world_cup_matches %>%
select(Year, `Home Team`, `Home Goals`) %>%
rename(Team = `Home Team`, Goals = `Home Goals`)
away_matches <- world_cup_matches %>%
select(Year, `Away Team`, `Away Goals`) %>%
rename(Team = `Away Team`, Goals = `Away Goals`)
all_matches <- rbind(home_matches, away_matches) %>%
filter(`Team` %in% fav_teams) %>%
select(Team) %>%
add_count(`Team`, name = "Matches") %>%
unique()
top_fav <- left_join(top_fav, all_matches, by = "Team") #union de tablas
top_fav$avg <- top_fav$total/top_fav$Matches #calculo de promedio de goles
# Tabla 3 Promedio de goles anotados en todas sus participaciones en el torneo dentro de los cinco (5) equipos favoritos para participar ala final de Qatar 2022 segun la casa de apuesta betfair"
reactable(
top_fav,
defaultSorted = "avg",
defaultSortOrder = "desc",
defaultColDef = colDef(
cell = data_bars(top_fav, text_position = "outside-base")
)
)Seguidamente, en respuesta a ¿Cuánto es el promedio de goles de las selecciones favoritas? la presente gráfica refleja a la selección con mayor promedio de anotación a Brasil con 2.1 goles por partido, seguido de Argentina con 1.69 y Francia con 1.82. Por lo tanto, las selecciones de España e Inglaterra poseen un promedio de 1.57 y 1.32 respectivamente.
# GRAFICA 4 promedio de goles anotados en todas sus participaciones en el torneo dentro de los cinco (5) equipos favoritos para participar a la final de Qatar 2022 segun la casa de apuesta betfair"
top_fav %>%
ggplot(aes(x = `Team`, y = `avg`, fill = `Team`)) +
geom_col() +
scale_fill_manual(values = c("cadetblue1", "seagreen3", "seashell1", "steelblue", "tomato2"), name = "Top 5") +
geom_text(aes(label = round(avg, digits = 2)), vjust = -1) +
xlab("Team") +
ylab("") +
theme_minimal() +
labs(title = "Promedio de goles anotado por partido",
subtitle = "dentro de los 5 equipos favoritos a participar a la final de Qatar 2022",
caption = "Fuente: Archivo de la Copa Mundial de la FIFA y RSSSF",
tag = "Figura 2",
x = "Selecciones",
y = "Promedio de Goles",
)El siguiente ranking considera el sistema de clasificación oficial de
la FIFA según los datos en la última publicación de la institución y de
los datos otorgados en el data set. De acuerdo al listado, las
principales selecciones que encabeza el ranking son:
Brasil, Bélgica, Argentina,
Francia e Inglaterra.
# Ranking FIFA de como inician al mundial las 32 selecciones
r_fifa22 <- X2022_world_cup_groups
r_fifa22 <- r_fifa22[with(r_fifa22, order(r_fifa22$`Group`)), ]
# Tabla 5 ranking FIFA de como inician al mundial las 32 selecciones
reactable(
r_fifa22,
defaultSorted = "FIFA Ranking",
defaultSortOrder = "asc",
defaultColDef = colDef(
cell = data_bars(r_fifa22, text_position = "outside-base")
)
)Según el sitio web Bendito Futbol los criterios para calcular los puntos del ranking consisten en:
En este caso, solo se tomará en cuenta los datos de la data set suministrado por Mavenanalytics en donde previamente describe los datos de la tabla y en la siguiente grafica se expone las 32 selecciones participantes en el torneo según su grupo en el torneo y numero de posición en el Ranking.
# Grafica 6 ranking FIFA de como inician al mundial las 32 selecciones
ggplot(r_fifa22, aes(y = Team, x = `FIFA Ranking`, color = `Group`, fill = `Group`)) +
geom_bar(stat = 'identity', width = 0.5, alpha = 0.25) +
geom_text(aes(label = `FIFA Ranking`), hjust = -1) +
theme_minimal() +
facet_wrap(~Group, scales = "free_y") +
labs(title = "Ranking FIFA de las selecciones que disputaran en",
subtitle = "Qatar 2022",
caption = "Fuente: Archivo de la Copa Mundial de la FIFA y RSSSF",
tag = "Figura 3",
y = "Selecciones",
x = "Posicion FIFA Ranking"
)Continuando con el análisis de los datos, se reflexiona en la siguiente tabla todos los juegos ganados, perdidos y empatados en el registro de los mundiales. Otorgando a su vez, la combinación de las tablas para agrupar cada resultado a su respectiva selección
# Resultados de historicos de juegos en la historia del FIFA World Cup
merge_matches <- function(df, f, cols) { # a traves de la funcion se obtiene los partidos ganados, perdidos y empatados
temp_cols <- c("Team", "Matches")
temp <- df
temp1 <- temp %>%
group_by(`Home Team`) %>%
summarise(`Home Goals` = sum(f(`Home Goals`, `Away Goals`)), )
colnames(temp1) <- temp_cols
temp2 <- temp %>%
group_by(`Away Team`) %>%
summarise(`Away Goals` = sum(f(`Away Goals`, `Home Goals`)), )
colnames(temp2) <- temp_cols
total <- merge(temp1, temp2, by = "Team", all = TRUE)
total$Matches <- total$Matches.x + total$Matches.y
total <- total[with(total, order(-Matches)), ]
total <- select(total, Team, Matches)
colnames(total) <- cols
total
}
# filtro cantidad de partidos ganados por seleccion e instancias que llegaron
total_wins <- merge_matches(world_cup_matches, `>`, c("Team", "Wins"))
#filtro cantidad de partidos empatados por seleccion e instancias que llegaron
total_ties <- merge_matches(world_cup_matches, `==`, c("Team", "Ties"))
#filtro cantidad de partidos perdidos por seleccion e instancias que llegaron
total_loss <- merge_matches(world_cup_matches, `==`, c("Team", "Loss"))
#Combinacion de tablas
all_matchs <- left_join(total_wins, total_ties, by = "Team") %>%
left_join(total_loss, by = "Team")
#Resultados de historicos de juegos en la historia del FIFA World Cup
all_WC <- select(all_matchs, Team, Wins, Ties, Loss)Como se observa, de todas las selecciones que han participado en el
mundial, Brasil sigue liderando en la cantidad de partidos
ganados, consecutivamente de Alemania e
Italia.
# Tabla 7 Tabla de Resultados de historicos de juegos en la historia del FIFA World Cup
reactable(
all_WC,
defaultSorted = "Wins",
defaultSortOrder = "desc",
defaultColDef = colDef(
cell = data_bars(all_WC, text_position = "outside-base")
)
)Al momento de reducir la tabla anterior por las selecciones participantes en Qatar 2022 se observa una diferencia en el tercer lugar, tomando lugar la selección de argentina dado a que la selección de Italia no logró clasificarse en las últimas eliminatorias.
# Resultados de historicos de juegos en la historia de los 32 equipos participantes
#en Qatar 2022
q_2022 <- all_WC %>% #filtro de las selecciones
filter(`Team` %in% c("Qatar", "Germany", "Denmark", "Brazil", "France",
"Belgium", "Croatia", "Spain", "Serbia", "England", "Switzerland", "Netherlands",
"Argentina", "Iran", "South Korea", "Japan", "Saudi Arabia", "Ecuador",
"Uruguay", "Canada","Ghana", "Senegal", "Portugal", "Poland", "Tunisia",
"Morocco", "Cameroon","Mexico", "United States", "Wales", "Australia",
"Costa Rica")) %>%
select(Team, Wins, Ties, Loss)
#Anexion de la seleccion de Qatar dado a que es su primera participacion en este torneo
q_2022 <- q_2022 %>%
rows_upsert(data.frame(Team = "Qatar", Wins = 0, Ties = 0, Loss = 0))## Matching, by = "Team"
# Tabla 8 Resultados de historicos de juegos en la historia de los 32 equipos participantes
#en Qatar 2022
reactable(
q_2022,
defaultSorted = "Wins",
defaultSortOrder = "desc",
defaultColDef = colDef(
cell = data_bars(q_2022, text_position = "outside-base")
)
)Siguiendo la narrativa del proyecto, y la pregunta de ¿Cómo se comparan a otras selecciones? a nivel grafico se contrasta entre los tres principales favoritos la cantidad de goles y partidos ganados, de este modo, se puede percibir con mayor precisión las tendencias entre los candidatos favoritos o considerados “fuertes” dentro del torneo según su registro histórico.
# 7 comparacion entre los candidatos fuertes dado a la cantidad de goles y de partidos ganados
top_4 <- total_wins$Team[1:4] #en este caso se obtienen a los 4 candidatos fuertes
home_matches <- world_cup_matches %>%
select(Year, `Home Team`, `Home Goals`) %>%
rename(Team = `Home Team`, Goals = `Home Goals`) #luego se obtienen los goles obtenidos segun su condicion
away_matches <- world_cup_matches %>%
select(Year, `Away Team`, `Away Goals`) %>%
rename(Team = `Away Team`, Goals = `Away Goals`)
all_matches <- rbind(home_matches, away_matches)
# Grafica 8 comparacion entre los candidatos fuertes dado a la cantidad de goles y de partidos ganados
all_matches %>%
filter(`Team` %in% top_4) %>%
group_by(`Team`, `Year`) %>%
summarise(`Goals` = sum(Goals)) %>%
ggplot(aes(x = factor(Year), y = Goals, color = Team, fill = Team)) +
geom_bar(stat = "identity", width = 0.5, alpha = 0.15) +
geom_text(aes(label = Goals), vjust = -1) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45)) +
ggtitle("Comparacion entre los 4 principales participantes", "Por pais") +
facet_wrap(~ Team)## `summarise()` has grouped output by 'Team'. You can override using the
## `.groups` argument.
Tal como se ha ido comentando la selección de Alemania y Brasil siguen
liderando en cuanto al éxito de goles y partidos ganados en cada
participación del torneo respaldando su posición como candidato a llegar
a la final del torneo. Cabe acotar que durante el periodo de 1938 – 1950
no hubo actividad en materia de mundial dado al panorama de guerra y de
reconstrucción económica en Europa. Sin embargo, en cuanto a partidos
jugados en finales, la selección de Alemania posee un mayor numero de
participaciones seguido de Brasil e Italia. Como hecho curioso, la
selección argentina no posee participación en terceros lugares a
diferencia de sus pares. Por último, hay que tomar en cuenta que las
primeras cinco fases de la grafica obedecen a los primeros formatos de
organización de la World Cup como se verá a continuación.
# posiciones logradas de esos candidatos en mundiales anteriores
top_4 <- total_wins$Team[1:4]
home_matches_by_stage <- world_cup_matches %>%
select(Year, `Home Team`, `Stage`) %>%
rename(Team = `Home Team`)
away_matches_by_stage <- world_cup_matches %>%
select(Year, `Away Team`, `Stage`) %>%
rename(Team = `Away Team`)
all_matches_by_stage <- rbind(home_matches_by_stage, away_matches_by_stage)
stages <- c("First group stage",
"Second group stage",
"First round",
"Final round",
"Group stage",
"Round of 16",
"Quarter-finals",
"Semi-finals",
"Third place",
"Final"
)
# Grafica 10 ultimas posiciones logradas de esos candidatos en mundiales anteriores
all_matches_by_stage %>%
filter(`Team` %in% top_4) %>%
group_by(`Team`, `Year`, `Stage`) %>%
distinct() %>%
ggplot(aes(x = factor(Stage, levels = stages), color = Team, fill = Team)) +
geom_bar(width = 0.5, alpha = 0.15) +
geom_text(stat = "count", aes(label = after_stat(count)), vjust = -1) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45)) +
ggtitle("Comparacion entre 4 principales participantes", "Por pais") +
facet_wrap(~ Team)Ya, por último, se puede reducir que a pesar de los datos y las estadísticas que se puede visualizar, los ganadores del torneo en ediciones pasadas se resumen en 8 selecciones, liderada como en diversas ocasiones del proyecto por Brasil con 5 copas obtenidas, seguido por Alemania e Italia con 4 copas para los tres primeros lugares de máximas copas concebidas tal como se puede observar en la gráfica. En el resto de las posiciones se encuentran argentina, Francia y Uruguay con 2 copas e Inglaterra y España con 1.
# grafica 11 ganadores de la copa
#lista de paises que participaron en las finales
final_rounds <- world_cup_matches %>%
filter(`Stage` == "Final round") %>%
select(`Year`, `Home Team`, `Away Team`) %>%
rename(Team = `Home Team`, Against = `Away Team`)
final_round <- tail(final_rounds, n = 1)
finals <- world_cup_matches %>%
filter(`Stage` == "Final")
finals_home <- finals %>%
filter(`Home Goals` > `Away Goals` | `Home Goals` == `Away Goals`) %>%
select(`Year`, `Home Team`, `Away Team`) %>%
rename(Team = `Home Team`, Against = `Away Team`)
finals_away <- finals %>%
filter(`Away Goals` > `Home Goals`) %>%
select(`Year`, `Home Team`, `Away Team`) %>%
rename(Team = `Away Team`, Against = `Home Team`)
all_finals <- rbind(finals_home, finals_away, final_round) %>%
add_count(`Team`, name = "Times")
all_finals %>%
select(`Team`, `Times`) %>%
unique() %>%
arrange(Times) %>%
ggplot(aes(x = reorder(Team, -Times), y = Times, color = Team, fill = Team, reorder(Team, Times))) +
geom_bar(stat = "identity", width = 0.5, alpha = 0.15) +
geom_text(aes(label = Times), vjust = -1) +
theme_minimal() +
ggtitle("Copas ganadas", "Por pais")Luego de realizar todo el análisis a la data set presentado, se resume las cuestiones más importantes a nivel de selecciones, entendiendo la cantidad de enfrentamientos y el resumen entre derrotas, victorias y empates a nivel de competencia mundial previo a Qatar 2022.
A través de las distintas tablas y graficas se muestra con el análisis y la data con respecto al conjunto de datos recopilados por la FIFA en el que se pudo identificar aproximadamente 900 partidos de copa mundial. El análisis a nivel de selección permitió a conocer la tendencia de los equipos favoritos, sumado a la cantidad de éxitos en los partidos y de goles anotados generando poca variación frente a equipos con menor tendencia de anotaciones.